数学概率统计09 假设检验的基本过程

假设检验的概念¶

假设检验(hypothesis testing)，又称统计假设检验，是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。

显著性检验是假设检验中最常用的一种方法，也是一种最基本的统计推断形式，其基本原理是先对总体的特征做出某种假设，然后通过抽样研究的统计推理，对此假设应该被拒绝还是接受做出推断。常用的假设检验方法有Z检验、t检验、卡方检验、F检验等

基本思想¶

假设检验的基本思想是小概率事件原理，其统计推断方法是带有某种概率性质的反证法。

小概率思想是指小概率事件在一次试验中基本上不会发生。反证法思想是先提出检验假设，再用适当的统计方法，利用小概率原理，确定假设是否成立。即为了检验一个假设$H_0$是否正确，首先假定该假设$H_0$正确，然后根据样本对假设$H_0$做出接受或拒绝的决策。如果样本观察值导致了“小概率事件”发生，就应拒绝假设$H_0$，否则应接受假设$H_0$

假设检验过程基于H0为真的初始假设进行的

假设检验中所谓“小概率事件”，并非逻辑中的绝对矛盾，而是基于人们在实践中广泛采用的原则，即小概率事件在一次试验中是几乎不发生的，但概率小到什么程度才能算作“小概率事件”，显然，“小概率事件”的概率越小，否定原假设H0就越有说服力，常记这个概率值为α(0<α<1)，称为检验的显著性水平。

对于不同的问题，检验的显著性水平$\alpha$不一定相同，一般认为，事件发生的概率小于0.1、0.05或0.01等，即“小概率事件".

检验统计量¶

根据样本观测结果计算得到且据以对原假设和备择假设做出决策的某个样本统计量，称为检验统计量。

检验统计量是用于假设检验计算的统计量，实际上是对总体参数的点估计量，但点估计量不能直接作为检验的统计量，只有将其标准化后，才能用于度量它与原假设的参数值之问的差异程度。而对点估计量的标准化依据原则是：

(1) 原假设$H_0$为真；
(2) 点估计量的抽样分布。

通常将标准化统计量简称为检验统计量，标准化的统计量可表示为： $$标准化统计量=\frac{点估计量-假设值}/{点估计量的抽样标准差}$$

备择假设与拒绝域¶

拒绝域亦称否定域，又称临界域，指在假设检验中根据检验统计量的分布，由给定的小概率$\alpha(0<\alpha<1)$作为显著性水平所确定的拒绝原假设$H_0$的区间，即统计量在其中取值的概率为$\alpha$的区域。

与拒绝域对应的是接受域。能够拒绝原假设的检验统计量的所有可能取值的集合，称为拒绝域；不能够拒绝原假设的检验统计量的所有可能取值的集合称为接受域；根据给定的显著性水平确定的拒绝域的边界值，称为临界值。

拒绝域的大小与人们事先选定的显著性水平有一定关系。在确定了显著性水平之后，就可以根据值的大小确定出拒绝域的具体边界值。

在给定显著性水平后，查统计表就可以得到具体的临界值。将检验统计量的值与临界值进行比较，就可做出拒绝或不拒绝原假设的决策。

当样本量固定时，拒绝域的面积随着$\alpha$的减小而减小。$\alpha$值越小，为拒绝原假设所需要的检验统计量的临界值与原假设的参数值就越远。

拒绝域的位置取决于检验是单侧检验还是双侧检验。

双侧检验的拒绝域在抽样分布的两侧。
单侧检验中，如果备择假设具有符号“<”，拒绝域位于抽样分布的左侧，称为左侧检验；如果备择假设具有符号“>”，拒绝域位于抽样分布的右侧，称为右侧检验。

tail 左上图为左侧检验，右上图为右侧检验，第二行图为双侧检验。

基本步骤¶

1、提出原假设(null hypothesis)，符号是$H_0$；备择假设(alternative hypothesis)的符号是H1(或Ha) 。
- $H_0$：样本与总体或样本与样本间的差异是由抽样误差引起的；
- $H_1$：样本与总体或样本与样本间存在本质差异；预先设定的检验水准为0.05；当检验假设为真，但被错误地拒绝的概率，记作$\alpha$，通常取$\alpha$=0.05或$\alpha$=0.01。
2、选定统计方法，由样本观察值按相应的公式计算出统计量的大小，如X2值、t值等。根据资料的类型和特点，可分别选用Z检验，T检验，秩和检验和卡方检验等。
3、判断结果
- 3.1 (方法1，p值法）根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。若P>α，结论为按α所取水准不显著，不拒绝H0，即认为差别很可能是由于抽样误差造成的，在统计上不成立；若$P\le \alpha$，结论为按所取α水准显著，拒绝$H_0$，接受$H_1$，则认为此差别不大可能仅由抽样误差所致，很可能是实验因素不同造成的，故在统计上成立。P值的大小一般可通过查阅相应的界值表得到。
- 3.2 （方法2，临界值法）将检验统计量的值与$\alpha$水平的临界值进行比较：
  - 双侧检验 |统计量的值| >临界值，拒绝；
  - 左侧检验统计量的值< 临界值，拒绝；
  - 右侧检验统计量的值>临界值，拒绝。

两类错误¶

在假设检验中，第一类错误是当原假设为真时拒绝了原假设。第二类错误是当原假设为假时，接受了原假设。

小结¶

本文简单介绍了假设检验的基本概念、思想和过程，在这个框架下我们进一步可以进行特定类型问题的检验，如大样本均值检验等。